# -*- coding: utf-8 -*-
__author__ = 'lztkdr'
__date__ = '2020/3/27 11:55'

"""
	estimator(估计器) 每一个预测算法，就是一个估计器。
	
		在sklearn中，估计器(estimator)是一个重要的角色，分类器和回归器都属于estimator，是一类实现了算法的API
	====================================================================================================	
		1、用于分类的估计器：
			sklearn.neighbors	k-近邻算法
			sklearn.naive_bayes      贝叶斯
			sklearn.linear_model.LogisticRegression     逻辑回归
			
		2、用于回归的估计器：
		sklearn.linear_model.LinearRegression     线性回归
		sklearn.linear_model.Ridge      岭回归
		
		标准化处理：
			K近邻、线性回归
		模型性能评估：
			分类模型，使用 得分
			线性模型，使用 均方误差
	====================================================================================================
		监督学习
			分类    k-近邻算法、贝叶斯分类、决策树与
			随机森林、逻辑回归、神经网络
			回归    线性回归、岭回归
			标注    隐马尔可夫模型     (不做要求)
		无监督学习
			聚类    k-means			
	====================================================================================================

		监督学习（英语：Supervised learning），可以由输入数据中学
		到或建立一个模型，并依此模式推测新的结果。输入数据是由
		输入特征值和目标值所组成。函数的输出可以是一个连续的值
		（称为回归），或是输出是有限个离散值（称作分类）。

		无监督学习（英语：Supervised learning），可以由输入数据中
		学到或建立一个模型，并依此模式推测新的结果。输入数据是
		由输入特征值所组成。

	监督学习    ==》 分类、回归  ==》 输入数据有特征有标签，即有标准答案
	无监督学习  ==》   聚类      ==》 输入数据有特征无标签，即无标准答案
			  
	====================================================================================================	
	特征选择 与 主成分分析 的比较？
		特征选择：
			定义：数据中包含冗余或无关变量（或称特征、属性、指标等），旨在从原有特征中找出主要特征。
		
		主成分分析：
			定义：高维数据转化为低维数据的过程，在此过程中可能会舍弃原有数据、创造新的变量
			作用：是数据维数压缩，尽可能降低原数据的维数（复杂度），损失少量信息。
			应用：回归分析或者聚类分析当中
		
"""





























